Содержание

Исследования рынка общепита в Москве для принятия решения об открытии нового заведения

Цель исследования - найти интересные особенности рынка заведений общественного питания Москвы и презентовать полученные результаты, которые в будущем помогут в выборе подходящего инвесторам места.

Ход исследования:

  1. Обзор данных
  2. Предобработка данных
  3. Анализ особенностей рынка заведений общественного питания Москвы
  4. Анализ особенностей рынка кофеен в Москве

Обзор данных

В таблице 'df' 14 столбцов, 8406 строк. В каждой строке информация об одном завелении. Типы данных float64(6), int64(1), object(7).

На гистограммах видны выбросы в значениях некоторых столбцов. В middle_avg_bill есть значения больше 30 000, в middle_coffee_cup есть значение 1500, а в столбце seats есть значения до 1250.

Выводы после обзора данных:

Предварительно можно утверждать, что данных достаточно для анализа. Но есть пропуски и выбросы.

План предобработки данных:

Предобработка данных

Обработка пропусков и дубликатов

Привели значения в столбце в адресом и названием заведения к нижниму регистру, чтобы найти неявные дубликаты. Будем считать неуникальными записи, где название и адрес заведения совпадают.

Удалили 4 неявных дубликата.

Явных дубликатов обнаружено не было. Было обнаружено и удалено 4 неявных дубликата.

Обнаружены пропуски в столбцах с данными, которые добавляют пользователи:

Также обнаружены пропуски в стобцах, заполненых автоматически:

Пропуски в данных, которые добавляют пользователем, могут быть из-за того, что пользователи не указывают нужные данные или из-за технических ошибок, связанных с обработкой этих данных.

Пропуски в столбцах заполненых автоматически появляются из-за того, что в они заполняются исходя из значений в столбце avg_bill и если в столбце avg_bill нет необходимой информации, то появляется пропуск.

Столбец middle_coffee_cup имеет 94% пропущенных значений, это связано с тем, что данный сталбец актуален только для заведений в категории "кофейня", для заведений из остальных категорий там пропуск.

Вывод

Поскольку пропуски содержатся только в столбцах с данными, которые заполняют пользователи, или с данными заполненными на их основе, то заменить эти пропуски мы не сможем. Оставим эти пропуски и проведем анализ с ними.

Обработка аномальных значений

На графике видно, что у столбца middle_avg_bill есть сильные выбросы вплоть до 35 000. Но остальные столбцы видно плохо, приблизим график, чтобы лучше их рассмотреть.

На этом графике видно, что у middle_coffee_cup есть выброс со значением больше 1500, а у столбца seats есть выбросы больше 1250. Скорее всего это не правильно заполненные данные и они могут повлиять на анализ данных. Поскольку данных мы будем работать с агрегированными данными, то удалять эти данные не стоит, следует брать медианные значения а не средние, так как на медиану меньше влияют выбросы.

Добавление новых столбцов

Выводы после предобработки данных

В ходе предобработки данных мы проверили данные на дубликаты, пропущенные значени и выбросы, добавили столбец с обозначением, что заведение работает ежедневно и круглосуточно и столбец с названиями улиц из столбца с адресом.

Явных дубликатов обнаружено не было. Было обнаружено и удалено 4 неявных дубликата.

Были обнаружены пропуски в столбцах:

Пропуски были обнаруженны только в столбцах с данными, которые заполняют пользователи, или с данными заполненными на их основе. Заменить такие пропуски мы не сможем. Приняли решение оставить эти пропуски и провести анализ с ними.

Были обнаружены аномальные значения в столбцах:

Скорее всего это не правильно заполненные данные, которые могут повлиять на анализ. Но так как мы будем оперировать аггрегированными данными, то мы решили не отбрасывать данные, а использовать медиану для получения средних значений, потому что на медиану не так сильно влияют выбросы.

Данные готовы к анализу.

Анализ особенностей рынка заведений общественного питания Москвы

Количество объектов общественного питания по категориям

В данных представлены 8 категорий заведений. Чтобы подробнее оценить распределение, построим круговую диаграмму.

Как видно на графике, большая часть заведений находится в категориях "кафе", "ресторан", "кофейня", они занимают большую часть всех заведений в Москве. Меньше всего булочных и столовых.

Количество посадочных мест в местах по категориям

Для анализа количества посадочных мест сгруппируем таблицу с медианным количеством мест на заведение по категориям. Используем медиану, а не среднее из-за того что в данных по посадочным местам есть сильные выбросы, которые мы заметили на этапе обзора и предобработки данных.

Визуализуруем данные для анализа.

Больше всего посадочных мест в заведениях в категории "ресторан", "бар,паб" и "кофейня", около 80 на заведение. Меньше всего в пиццериях и булочных, около 50.

Cоотношение сетевых и несетевых заведений

На диаграмме видно, что несетевых заведений существенно больше, чем сетевых.

Рассмотрим категории сетевых заведений

Больше всего сетевых заведений в категории "булочная" около 60%. Далее идут пиццерии и кофейни, в этих категориях доля сетевых заведений около 50%. Меньше всего сетевых заведений в категории "бар,паб" около 20%.

Топ-15 популярных сетей в Москве

В топ-15 популярных сетей в Москве первые 10 мест заняли франшизы. На первом месте находится сеть Шоколадница с более чем 120 заведениями.

Последние 5 мест занимают частные сетевые заведения, на первом месте среди них Теремок, чуть меньше 40 заведений по всей Москве.

Количество заведений по районам

Как видно на графике, больше всего заведений находится в Центральном административном округе, из них большая часть это рестораны, кафе, кофейни и бары. В ЦАО гораздо больше баров, относительно других категорий, по сравнению с остальными районами. А вот заведений быстрого питания наоборот меньше, относительно других категорий, по сравнению с остальными районами.

Из-за большого количества заведений в ЦАО, на графике плохо видо остальные районы. Ограничим ось x до значении 1200, чтоб рассмотреть другие районы.

Меньше всего заведений в Северо-Западном административном округе. Распределение категорий в разнах районах за исключением ЦАО примерно одинаковое. Большую часть занимаю кафе, рестораны и кофейни.

Средний рейтинг заведений по категориям

Как видно на графике, средний рейтинг по категориям не сильно отличается в разных категориях. Самый низкий средний рейтинг в категории "быстрое питание" - около 4, самый высокий в категории "бар,паб" - около 4,5.

Построим фоновую картограмму (хороплет) со средним рейтингом заведений каждого района.

На картограмме явно выделяется Центральный административный округ, там самый высокий средний рейтинг заведений. Хуже всего с рейтингом обстоят дела в Юго-Восточном административном округе.

Отобразим все заведения на карте

Отобразили все заведения в датасете с помощью кластеров на карте.

Топ-15 улиц по количеству заведений

Больше всего заведений на проспекте Мира, целых 183. Замыкает топ-15 ул.Миклухо-Маклая с 47 заведениями. Распределение категорий в на топ-15 улицах примерно одинаковое. Большую часть занимают кафе, рестораны и кофейни. На графике можно заметить, что есть несколько улиц вообще без булочных. И несколько улиц на которых очень мало заведений быстрого питания, относительно других категорий, по сравнению с другими улицами.

Заведения, которые являются единственными на своей улице

На 32% улиц есть только одно заведение общественного питания.

Больше всего таких улиц в Центральном административном округе, меньше всего таких улиц в Северо-Западном и Юго-Западном административных округах.

Цены в центральном административном округе и других районах

Построим фоновую картограмму (хороплет) со медианным чеком заведений каждого района

Самый высокий средний чек в Центральном и Западном административных округах, самый низкий в Северо-Восточном, Южном и Юго-Восточном административных округах.

Исследуем зависимость между ценами и расстоянием до центра

На графике видно, что чем дальше от центра, тем ниже средний чек.

Корреляция среднего чека и расстояния до центра заметная, можно утверждать, что чем дальше от центра, тем ниже средний чек. Однако стоит напомнить, что средний чек заполнен только у 45% заведений.

Вывод после анализа особенностей рынка заведений общественного питания Москвы

Мы проанализировали датасет с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года. Выявили наиболее распостраненные категории заведений, количество посадочных мест на одно заведение, самые большие сети и их распределение по округам, а также средний рейтинг, средний чек по разным округам.

Данные показывают, что в Москве есть 8 категорий заведений общественного питания, при этом кафе, рестораны и кофейни являются наиболее распространенными, составляя почти 70% всех заведений.

Наибольшее количество посадочных мест на одно заведение находится в ресторанах, барах/пабах и кофейнях, около 80 мест на одно заведение, в то время как в пиццериях и булочных мест меньше, около 50.

Большая часть заведений не сетевые - 62%. Больше всего сетевых заведений в категории "булочная" около 60%. Далее идут пиццерии и кофейни, в этих категориях доля сетевых заведений около 50%. Меньше всего сетевых заведений в категории "бар,паб" около 20%.

В топ-15 популярных сетей в Москве доминируют франшизы, при этом самой большой является сеть "Шоколадница" с более чем 120 заведениями. Частные сетевые заведения занимают последние 5 мест, при этом самой большой среди них является "Теремок" с чуть менее чем 40 заведениями по всей Москве.

Большинство заведений находится в Центральном административном округе, при этом большинство из них являются ресторанами, кафе, кофейнями и барами. А вот количество заведений быстрого питания в ЦАО ниже, чем в других категориях.

Самый высокий средний рейтинг заведений находится в Центральном административном округе, а самый низкий - в Юго-Восточном административном округе.

Из топ-15 улиц по количеству заведений, больше всего заведений находится на проспекте Мира, целых 183.

На 32% улиц есть только одно заведение общественного питания, при этом больше всего таких улиц находится в Центральном административном округе, а меньше всего - в Северо-Западном и Юго-Западном административных округах.

Самый высокий средний чек находится в Центральном и Западном административных округах, а самый низкий - в Юго-Восточном, Южном и Северо-Восточном административных округах.

Самая высокая медианная цена за чашку капучино в заведениях находится в Юго-Западном и Центральном административных округах, а самая низкая - в Юго-Восточном и Восточном административных округах.

Есть заметная корреляция между средним чеком и расстоянием от центра, чем ближе заведение к центру города, тем больше средний чек.

Анализ кофеен

Количество и распределение по районам кофеен в датасете

Больше всего кофеен находится в Центральном административном округе, меньше всего в Северо-Заподном административном округе.

Количество круглосуточных кофеен

Подавляющие большинство кофеен не круглосуточные.

Средний рейтинг кофеен по районам

Кофейни с самым выкоким рейтингом находятся в Центральном административном округе, а самый низкий рейтинг у кофеен в в Западном административном округе.

Средняя цена одной чашки капучино по районам

Построим фоновую картограмму (хороплет) со медианной ценой одной чашки капучино в заведениях каждого района

Самая высокая медианная цена одной чашки капучино в заведениях в Юго-Западном и Центральном административных окруах, самая маленькая в Юго-Восточном и Восточном административных округах.

При открытии коффейни стоит ориентироваться на среднюю стоимость чашки в Центральном округе, там больше всего кофеен. А цена за чашку кофе не такая высока, как в Юго-Западном округе.

Зависимость между удаленность от центра и стоимостью одной чашки капучино

Заметной корреляции между средней ценой одной чашки капучино и удаленностью от центра нет.

Вывод после анализа кофеен

Мы проанализировали кофейни Москвы из датасета составленного на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года. Выявили количество кофеен и их распределение по округам, а также средний рейтинг и средную цену одной чашки капучино по разным округам.

В нашем датасете содержится информация о 1413 кофеен. Большинство из них расположены в Центральном административном округе, в то время как наименьшее количество кофеен находится в Северо-Западном административном округе.

В основном, кофейни не работают круглосуточно.

Лучшие кофейни по рейтингу также располагаются в Центральном административном округе, в то время как самые низкооцененные кофейни находятся в Западном административном округе.

Медианная стоимость чашки капучино самая высокая в Юго-Западном и Центральном административных округах, а самая низкая - в Юго-Восточном и Восточном административных округах. Однако стоимость чашки капучино не зависит от удаленности кофейни от центра города.

Открывая новое заведение, стоит ориентироваться на среднюю цену чашки кофе для Центрального административного округа, которая составляет 190 рублей, там больше всего кофеен, а цена за чашку кофе не такая высокая, как в Юго-Западном округе. Это позволит вам быть конкурентоспособными на рынке и привлечь целевую аудиторию, готовую тратить средства на качественный кофе и атмосферу.

Рекомендация для открытия нового заведения

На основе предоставленных данных, мы рекомендуем открыть кофейню в Центральном административном округе Москвы. Этот район имеет наибольшее количество кофеен, что указывает на высокий спрос и поток посетителей. К тому же, средний рейтинг кофеен в этом районе самый высокий, что говорит о качестве предлагаемых услуг и удовлетворенности клиентов.

Однако, учтите, что конкуренция в Центральном административном округе может быть выше, поэтому важно предложить уникальную концепцию и высокое качество услуг, чтобы выделиться среди конкурентов. Мы рекомендуем рассмотреть возможность проведения дополнительного исследования рынка и анализа конкурентов, чтобы принять обоснованное решение.

Мы рекомендуем провести:

Проведение таких исследований поможет вам принять обоснованное решение о том, где и как открыть кофейню, а также определить оптимальную стратегию для ее развития и успеха на рынке.

Общий вывод исследования

Анализ особенностей рынка общественного питания Москвы

Мы проанализировали датасет с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года. Выявили наиболее распостраненные категории заведений, количество посадочных мест на одно заведение, самые большие сети и их распределение по округам, а также средний рейтинг, средний чек по разным округам.

В Москве наиболее распространенными категориями заведений общественного питания являются кафе, рестораны кофейни, которые составляют почти 70% всех заведений.

Рестораны, бары/пабы и кофейни имеют наибольшее количество посадочных мест на одно заведение, около 80 мест, в то время как в пиццериях и булочных мест меньше, около 50.

Самая большая сеть в Москве - "Шоколадница" с более чем 120 заведениями.

Большинство заведений находится в Центральном адмистративном округе, при этом большинство из них являются ресторанами, кафе, кофейнями и барами.

Самый высокий средний рейтинг заведений находится в Северо-Восточном административном округе, а самый низкий - в Восточном административном округе.

Самый высокий средний чек находится в Центральном и Западном административных округах, а самый низкий - в Юго-Восточном, Южном и Северо-Восточном административных округах.

Чем ближе заведение к центру города, тем больше средний чек.

Анализ кофеен

Дополнительно мы проанализировали кофейни Москвы. Выявили количество кофеен и их распределение по округам, а также средний рейтинг и средную цену одной чашки капучино по разным округам.

Большинство из них расположены в Центральном административном округе, в то время как наименьшее количество кофеен находится в Северо-Западном административном округе. В основном, кофейни не работают круглосуточно.

Лучшие кофейни по рейтингу также располагаются в Центральном административном округе, в то время как самые низкооцененные кофейни находятся в Западном административном округе.

Медианная стоимость чашки капучино самая высокая в Юго-Западном и Центральном административных округах, а самая низкая - в Юго-Восточном и Восточном административных округах. Однако стоимость чашки капучино не зависит от удаленности кофейни от центра города.

Рекомендация для открытия нового заведения

На основе предоставленных данных, мы рекомендуем открыть кофейню в Центральном административном округе Москвы. Этот район имеет наибольшее количество кофеен, что указывает на высокий спрос и поток посетителей. К тому же, средний рейтинг кофеен в этом районе самый высокий, что говорит о качестве предлагаемых услуг и удовлетворенности клиентов.

Что касается стоимости чашки капучино, ориентируйтесь на среднюю цену для Центрального административного округа, которая составляет 190 рублей. Это позволит вам быть конкурентоспособными на рынке и привлечь целевую аудиторию, готовую тратить средства на качественный кофе и атмосферу.